Impact du degré de supervision sur l'adaptation à un domaine d'un modèle de langage à partir du Web (Impact of the level of supervision on Web-based language model domain adaptation) [in French]
نویسندگان
چکیده
Impact of the level of supervision on Web-based language model domain adaptation Domain adaptation of a language model aims at re-estimating word sequence probabilities in order to better match the peculiarities of a given broad topic of interest. To achieve this task, a common strategy consists in retrieving adaptation texts from the Internet based on a given domain-representative seed text. In this paper, we study the influence of the choice of this seed text on the adaptation process and on the performances of adapted language models in automatic speech recognition. More precisely, the goal of this original study is to analyze the differences between supervised adaptation, in which the seed text is manually generated, and unsupervised adaptation, where the seed text is an automatic transcript. Experiments carried out on videos from a real-world use case mainly show that differences vary according to adaptation scenarios and that the unsupervised approach is globally convincing, especially according to its low cost. MOTS-CLÉS : Modèle de langage, adaptation à un domaine, supervision, données du Web.
منابع مشابه
Une Nouvelle Approche pour l'Adaptation d'un Hypermédia Pédagogique au Profil Cognitif de l'Apprenant en Utilisant XML
Il existe plusieurs travaux sur les hypermédias adaptatifs ;Très peu se sont intéressés à l’adaptation de la forme en fonction de profils cognitifs . Dans ce travail, notre intérêt porte sur l’adaptation des contenus des pages et des liens en se basant sur le modèle de connaissances de l'apprenant et en fonction d’objectifs pédagogiques, et sur l’adaptation de la présentation en fonction du pro...
متن کاملفایل کامل مجلّه مطالعات زبان فرانسه دو فصلنامه علمی پژوهشی زبان فرانسه دانشکده زبانهای خارجی دانشگاه اصفهان
Tâ ÇÉÅ wx W|xâ Revue des Études de la Langue Française Revue semestrielle de la Faculté des Langues Étrangères de l'Université d'Ispahan Cinquième année, N° 8 Printemps-Eté 2013, ISSN 2008- 6571 ISSN électronique 2322-469X Cette revue est indexée dans: Ulrichsweb: global serials directory http://ulrichsweb.serialssolutions.com Doaj: Directory of Open Access Journals http://www.doaj.org ...
متن کاملUne méthode de formalisation progressive des exigences basée sur un modèle simulable
RÉSUMÉ. Les exigences d’un logiciel, souvent rédigées en langage naturel, sont à la base des phases de conception et de test fonctionnel. Le langage naturel est par nature ambigu, et les exigences peuvent donc être différemment interprétées lors de la construction et de la validation du logiciel. C’est pourquoi nous proposons une méthode de raffinement progressif des exigences vers des modèles ...
متن کاملViolence du langage dans l’œuvre dramatique de Samuel Beckett : la quête du néant
L’homme beckettien représente grosso modo sur la scène de théâtre des années cinquante le spectacle de souffrance physique et de désintégration totale du sujet qui est le fait d’un trauma et d’un complexe plus profonds, celui du vide de matières scéniques et du mal fondamental qu’on traiterait d’existentiel. En d’autres termes, le mal est dans ce monde quelque chose d’inné chez l’être humain. C...
متن کاملUn navigateur pour les données liées du Web
Le Web de documents structurés qui repose sur le standard XML a rapidement été muni du standard XSLT pour engendrer des formats de présentation tels que HTML ou bien pour écrire des transformations de XML vers XML. De la même manière, le Web de données sémantiques qui repose sur le standard RDF a maintenant besoin d’un langage de transformation pour présenter les données RDF dans des formats li...
متن کامل